正面硬刚Claude Opus 4.6:我们给GLM-5.1使了三个“绊子”,它居然…
正面硬刚Claude Opus 4.6:我们给GLM-5.1使了三个“绊子”,它居然…今天,智谱正式开源其最强模型GLM-5.1,这一模型在专业软件开发基准测试SWE-Bench Pro中,GLM-5.1刷新全球最佳成绩,得分达到58.4,超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型,和MiniMax M2.7、Kimi K2.5等开源模型。
今天,智谱正式开源其最强模型GLM-5.1,这一模型在专业软件开发基准测试SWE-Bench Pro中,GLM-5.1刷新全球最佳成绩,得分达到58.4,超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型,和MiniMax M2.7、Kimi K2.5等开源模型。
Claude Code 负责人 Boris Cherny 最近可能很头疼,因为这款神级 AI 在快速更新的同时被曝出各种问题。
和之前 Claude Code 泄漏的代码揭示的一样,Claude Mythos 它真的来了。今天凌晨,Anthropic 发布了大量关于其新模型 Claude Mythos Preview 的信息(包含一份长达 244 页的系统卡)。同时,Anthropic 还宣布了一个基于此模型的 AI 网络安全项目 Project Glasswing。
上个月,Anthropic 最强模型 Claude Mythos 意外被曝光。 被泄露的内部文档里面写着,它比 Anthropic 的 Opus 模型更大、更智能,是迄今为止开发过的最强大的 AI 模
在官方仓库贴脸开大,热议Issue指出:Claude Code已经更新“废了”。某次更新让思考深度下降67%,当前版本已无法胜任复杂工程任务。“无视用户指令”“执行与用户要求完全相反的操作”“假装说任务已完成”……模型行为全面走样。
真赞叹啊,一行指令,而且,速度还贼快!
最近三个月,我用 Claude Code Vibe Coding 了几个项目,非常有意思,写篇文章记录一下。
昨天,AI 圈最雷霆的新闻就是:Anthropic 正式宣布封禁 OpenClaw。 OpenClaw 的创始人 Peter 一脸懵逼,说 Anthropic 抄了他们的功能,转手又把他们给封了。
Agent 时代,我们需要正确的计费和工程设计哲学,这是 Xiaomi MiMo 大模型负责人罗福莉刚刚在 X 上发表的观点。前两天,我们报道了一则消息 ——Anthropic 宣布,即日起,Claude Pro 和 Max 订阅用户,不得再将订阅额度用于 OpenClaw 等第三方 Agent 框架。想继续用?那就必须切换到按用量付费的 API。
全球最安全系统,被AI攻破了!Claude 4小时攻破了全球最安全OS内核,从零写出国家级攻击程序,彻底跨越卢比孔河。人类防御60天,AI只要4小时,所有旧秩序,都在加速崩盘。